Gemini tomará el control de tus aplicaciones: así funciona la nueva automatización de pantalla de Google

La industria está empeñada en que los asistentes de inteligencia artificial se conviertan en agentes capaces de ejecutar acciones complejas. Tras las demostraciones iniciales de Project Astra durante el Google I/O de 2025, nuevas evidencias sugieren que esta capacidad está mucho más cerca de llegar a los usuarios finales.

El código encontrado en la última versión beta de la aplicación de Google revela cómo Gemini podrá interactuar directamente con otras aplicaciones instaladas en el teléfono para realizar tareas en nombre del usuario.

Esta funcionalidad, identificada internamente con el nombre en clave «bonobo», se presenta al usuario bajo el término de automatización de pantalla. Según las líneas de código descubiertas en la versión 17.4.66 beta, esta característica permitirá a la IA realizar acciones cotidianas sin que el usuario tenga que tocar la pantalla activamente.

Entre los ejemplos citados en la filtración se incluyen tareas prácticas como solicitar un transporte en aplicaciones tipo Uber o realizar pedidos de comida a domicilio, gestionando el desplazamiento y los toques necesarios en la interfaz de forma autónoma.

La integración de estos agentes busca transformar la manera en que interactuamos con el sistema operativo Android. En lugar de limitarse a leer texto o analizar imágenes estáticas, Gemini tendrá la capacidad de navegar por los menús y ejecutar comandos, actuando efectivamente como un operador virtual del dispositivo.

Gemini advierte que el usuario será el responsable final de las acciones de la IA

A pesar de la promesa de automatización, Google parece estar adoptando un enfoque cauteloso respecto a la autonomía total de la herramienta. El código analizado incluye advertencias explícitas que indican que Gemini puede cometer errores. Por ello, el sistema instará a los usuarios a supervisar el proceso de cerca mientras la IA opera el teléfono.

Otro aspecto crucial revelado en esta filtración concierne a la privacidad y el manejo de datos sensibles. Las cadenas de texto advierten que, cuando la función de actividad está activada, las capturas de pantalla generadas durante la interacción pueden ser revisadas por evaluadores humanos para mejorar el servicio. Debido a esto, se recomienda encarecidamente no introducir información confidencial, como credenciales de inicio de sesión o detalles de pago, durante las sesiones de chat con el asistente automatizado.

Te interesa 👉 Lo que nadie quería llega a ChatGPT: su código revela que OpenAI ya prepara la publicidad para frenar las pérdidas millonarias

Tal y como ha revelado Android Authority, Google también está preparando secciones dedicadas a Pedidos y Compras dentro de la interfaz de usuario para gestionar estas nuevas capacidades transaccionales.

Fuente